Recherche de sous-structures fréquentes pour l'intégration de schémas XML

نویسندگان

  • Federico Del Razo López
  • Anne Laurent
  • Pascal Poncelet
  • Maguelonne Teisseire
چکیده

Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle. Dans cet article, nous proposons des algorithmes de recherche de sous-schémas fréquents basés sur une méthode originale de représentation de schémas XML. Nous décrivons brièvement la structure adoptée pour ensuite détailler les algorithmes de recherche de sous-arbres fréquents s’appuyant sur une telle structure. La représentation proposée et les algorithmes associés ont été évalués sur différentes bases synthétiques de schémas XML montrant ainsi l’intérêt de l’approche proposée.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Une représentation des arborescences pour la recherche de sous-structures fréquentes

Résumé. La recherche de structures fréquentes au sein de données arborescentes est une problématique actuellement très active qui trouve de nombreux intérêts dans le contexte de la fouille de données comme, par exemple, la construction automatique d’un schéma médiateur à partir de schémas XML. Dans ce contexte, de nombreuses propositions ont été réalisées mais les méthodes de représentation des...

متن کامل

Modélisation de la cognition sociale - Propositions autour de l'utilisation de schémas cognitifs

Ce travail de recherche est fondé sur une approche multidisciplinaire, comprenant les systèmes multi-agents utilisés pour modéliser des organisations et les interactions entre des acteurs organisationnels, les cartes cognitives pour représenter les croyances des agents artificiels et des schémas pour modéliser des structures cognitives de haut niveau. Cette recherche est fondée sur la reconnais...

متن کامل

Intégration de sources hétérogènes par matching semi-automatique de schémas XML étendus

RÉSUMÉ. Lors de l’intégration de sources de données hétérogènes, une des tâches les plus importantes est la transformation (semi-)automatique de ces sources par une phase de recherche de correspondances appelée schema matching. Le but de cet article est de proposer une solution lors de la phase de matching entre des schémas XML étendus appelés EXS (Enhanced XML Schemas). L’ensemble des schémas ...

متن کامل

Méthodologie de Matching à large Echelle de schémas XML

RÉSUMÉ. Le matching, est une opération importante pour les processus assurant l’interopérabilité de systèmes d’information notamment pour des applications telles que l'échange, l'intégration et la transformation de données. Toutefois, la problématique du matching se pose avec acuité lorsque le nombre et le volume des schémas de données est important. C’est notamment le cas pour les applications...

متن کامل

Comparaison de critères de pureté pour l'intégration de connaissances en clustering semi-supervisé

Résumé. L’utilisation de connaissances pour améliorer les processus de fouille de données a mobilisé un important effort de recherche ces dernières années. Il est cependant souvent difficile de formaliser ce type de connaissances, comme celles-ci sont souvent dépendantes du domaine. Dans cet article, nous nous intéressons à l’intégration de connaissances sous la forme d’objets étiquetés dans le...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006